การเปลี่ยนผ่านไปสู่โมเดลที่ปรับแต่งตามคำสั่ง
รากฐานคืออะไร?
ในอดีต โมเดลฐาน (Base LLMs) ถูกฝึกให้คาดการณ์คำถัดไปในลำดับจากข้อมูลจำนวนมาก อย่างไรก็ตาม สำหรับนักพัฒนา ความแข็งแกร่งจริงอยู่ที่โมเดลที่ปรับแต่งตามคำสั่ง (Instruction Tuned LLMs) โมเดลเหล่านี้ได้รับการปรับปรุงโดยใช้การเรียนรู้เสริมจากการให้ข้อเสนอแนะจากมนุษย์ (RLHF) เพื่อปฏิบัติตามคำสั่งเฉพาะเจาะจงและทำหน้าที่เป็นผู้ช่วยที่มีประโยชน์
กฎทองคำ: จัดการกับโมเดลภาษาแบบนี้เหมือนกับพนักงานใหม่ที่ฉลาดแต่ตีความตรงๆ โมเดลไม่มีบริบทเฉพาะของคุณ ดังนั้นคุณต้องชี้แจงเป้าหมายของคุณอย่างชัดเจน
วิธีประยุกต์หลักการสำคัญ
- ความชัดเจนและความเฉพาะเจาะจง: ความชัดเจนไม่ได้หมายถึงการกระชับ ควรให้บริบทเพิ่มเติม และใช้เครื่องหมายแยก (delimiters) (เช่น สามเส้นบัคกิ้งหรือแท็ก XML) ช่วยให้โมเดลแยกแยะคำสั่งของคุณออกจากข้อมูลที่ต้องประมวลผลได้
- ให้โมเดลเวลาในการคิด: งานที่ซับซ้อนต้องใช้ห่วงโซ่การคิด หากคุณขอให้โมเดลข้ามขั้นตอนมาถึงข้อสรุปทันที มันมีแนวโน้มที่จะเกิดข้อผิดพลาดในการอนุมาน จงแนะนำให้มันคิดหาทางออกของตนเองก่อน
หลีกเลี่ยงการสร้างภาพลวงตา
โมเดลอาจสร้างข้อมูลที่ฟังดูสมเหตุสมผลแต่เป็นเท็จ จงตรวจสอบข้อเท็จจริงเสมอ หรือระบุให้โมเดลอ้างอิงแหล่งที่มาเพื่อลดความเสี่ยงนี้
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Why should a developer prefer an Instruction Tuned LLM over a Base LLM for building an application?
Challenge: Generating Structured Data
Apply prompting principles to format output.
You have a list of ingredients. You need to convert this list into a JSON format for a web app.
Task
Write a prompt that requests JSON output with keys for 'item' and 'quantity'. Include a condition check: If the input is not a recipe, output "No recipe detected."
Solution:
prompt = "You will be provided with text. If it contains a recipe, convert it to JSON with keys 'item' and 'quantity'. If not, write 'No recipe detected.' Text: <user_input>"